Carbon Forum » 搜索 » user:hadoop小学生 post:true

中文分词工具之基于字标注法的分词

基于字标注法的分词

中文分词字标注通常有

hadoop小学生 •  2019-06-26

自然语言处理工具中的中文分词器介绍


中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块,不同于英文的是,中文句子中没有词的界限,因此在进行中文自然语言处理时,通常需要先进行分词,分词效果将直接影响词性,句法树等模块的效果,当然分词只是一个工具,场景不同,要求也不同。在人机自然语言交互中,成熟的

hadoop小学生 •  2019-06-24

Hanlp配置自定义词典遇到的问题与解决方法

本文是整理了部分网友在配置hanlp自定义词典时遇到的一小部分问题,同时针对这些问题,也提供另一些解决的方案以及思路。这里分享给大家学习参考。

hadoop小学生 •  2019-06-17

如何在java中去除中文文本的停用词

1.  整体思路

第一步:先

hadoop小学生 •  2019-05-06

java中利用hanlp比较两个文本相似度的步骤


使用 HanLP - 汉语言处理包 来处理,他能处理很多事情,如分词、调用分词器、命名实体识别、人名识别、地名识别、词性识别、篇章理解、关键词提取、简繁拼音转换、拼音转换、根据输入智能推荐、自定义分词器

hadoop小学生 •  2019-05-06

HanLP 自然语言处理 for nodejs

·支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxE

hadoop小学生 •  2019-04-24

HanLP Analysis for Elasticsearch

基于 HanLP 的 Elasticsearch 中文分词插件,核心功能:

php hadoop小学生 •  2019-04-22

HanLP vs LTP 分词功能测试


 

文章摘自github,

hadoop小学生 •  2019-04-19

HanLP中文分词Lucene插件

 基于HanLP,支持包括Solr(7.x)在内的任何基于Lucene(7.x)的系统。

hadoop小学生 •  2019-04-15

pyhanlp:hanlp的python接口


HanLP的Python接口,支持自动下载与升级HanLP,兼容py2、py3。

hadoop小学生 •  2019-04-12

Hanlp自然语言处理工具之词法分析器


本章是接前两篇《分词工具Hanlp基于感知机的中文分词框架》和《基于结构化感知机的词性标注与命名实体识别框架》的。

hadoop小学生 •  2019-04-10

基于结构化感知机的词性标注与命名实体识别框架


上周就关于《结构化感知机标注框架的内容》已经分享了一篇《分词工具Hanlp基于感知机的中文分词框架》,本篇接上一篇内容,继续分享词性标注与命名实体识别框架的内容。

hadoop小学生 •  2019-04-08

分词工具Hanlp基于感知机的中文分词框架



结构化感知机标注框架是一套利用感知机做序列标注任务,并且应用到中文分词、词性标注与命名实体识别这三个问题的完整在线学习框架,该框架利用1个算法解决3个问题,时自治同意的系统,同时三个任务顺序渐进,构成流水线式的系统。本文先介

hadoop小学生 •  2019-04-03

汉语言处理工具pyhanlp的拼音转换与字符正则化

汉字转拼音

HanLP中的汉字转拼音功能也十分的强大。

hadoop小学生 •  2019-03-29

汉语言处理工具pyhanlp的简繁转换

繁简转换

HanLP几乎实现了所有我们需要的繁简转换方式

hadoop小学生 •  2019-03-29
登 录
信息栏

Carbon Forum是一个基于话题的高性能轻型PHP论坛

下载地址:Carbon Forum v5.9.0
QQ群:12607708(QQ我不常上)

donate

手机支付宝扫描上方二维码可向本项目捐款

粤公网安备 44030602003677号
粤ICP备17135490号